بررسی مشکلات جستوجو و بازیابی اطلاعات در پایگاههای اطلاعاتی از جنبه ویژگیهای نگارشی زبان فارسی

نویسندگان

چکیده مقاله:

The present research was carried out with the aim of explicating the major writing and semantic problems of Persian language when using data environments and determining the degree of compatibility and attention to these features in Persian databases. This research is of survey analytical type being conducted through direct observation. Having reviewed the related literature, we kept a checklist of search keywords. Each of these keywords was searched in the databases under study, such as Iranian Research Institute for Information Science and Technology, Regional Centre for Information Science and Technology, NoorMagaz, and Scientific Information Database affiliated with Jahad Daneshgahi, and the number of retrieved findings was recorded. Some of the writing and semantic features of Persian language contribute to problems associated with retrieving information from the selected databases. Some of these features include connected and disconnected forms of writing of derivative, compound, and derivative-compound words, diversity of plural forms, loanwords and their equivalents in writing as well as polysemy, homonymy, etc., in semantics. For instance, retrieving different results for various writing forms of the keywords «فناوری و فن آوری» as derivative-compound words or «پتاسیوم و پتاسیم» as various forms of recording words, or retrieving different findings for keywords «دریای خزر، دریای مازندران و دریای کاسپین»  as well as lack of their appropriate coverage as synonymous words and giving the user information about it in order to improve the exploration process, for it has negative effects on search and retrieval process. Findings indicated that Persian databases do not pay adequate attention to writing and semantic features of Persian language, and disregard many of its features in searching and retrieving information. In connection with the impact of these features on the interaction of users with databases, Persian-speaking users’ need for native exploration tools and databases designed in accordance with the features of their own language have become more and more urgent. The present research has examined the ability of Persian databases in covering some of the features of this language, which have a noticeable impact on the process of searching and retrieval, pinpointing the weak points and strengths of these databases. The results of the present research could be utilized to improve the performance of the above-mentioned databases.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بررسی رویکردهای موضوعی (زبان طبیعی و کنترل‌شده) در بازیابی اطلاعات از پایگاههای پیوسته کتابشناختی

در این پژوهش کاربردی که با استفاده از تحلیل محتوا انجام شده است، کارایی دو رویکرد جستجوی موضوعی: زبان طبیعی و واژگان کنترل شده با استفاده از معیارهای ربط، دقت، بازیافت و ریزش کاذب، در دو پایگاه کتابشناختی پیوسته (کتابخانه کنگره واریک) مقایسه شده است. سی عنوانمربوط به موضوعات کتابخانه، کتابداری و اطلاع‌رسانی به صورت تصادفی انتخاب شدند. برای هر عنوان راهب...

متن کامل

همبستگی نظریه امیدواری در دقت بازیابی اطلاعات از پایگاههای اطلاعاتی علوم پزشکی

The purpose of this study was to determine correlation of hope theory on precision of users’ information retrieval from databases of medical science. Research method was quasi experimental, and the population consisted of 45 final year medical students at medical Universities in Tehran. The data gathering instrument was the Schneider (1991) hope questionnaire that has 12 questions. Schneider qu...

متن کامل

بررسی تأثیرات ریشه‌یابی در بازیابی اطلاعات در زبان فارسی

Using the language-specific behavior in information retrieval systems can improve the quality of the retrieved results significantly. Part of the word that remains after removing its affixes is called stem. Stemming process can be used for improving the relevancy of the results in information retrieval system. Different morphological variants of words (plural, past tense…) will be mapped into t...

متن کامل

آسیب‌شناسی انگلیسی‌نویسی مآخذ فارسی در مقالات و چالش‌های آن در بازیابی اطلاعات از پایگاه‌های اطلاعاتی

هدف: آسیب‌شناسی منابع فارسی که به‌صورت انگلیسی نوشته می‌شوند در نظام جستجوی پایگاه‌های اطلاعاتی ایرانی. روش‌شناسی: با رویکرد ترکیبی از طریق دو روش تحلیل‌محتوا و پیمایش 30 نشریه علمی پژوهشی از سه حوزه وزارت علوم، وزارت بهداشت و دانشگاه آزاد از سال 1384 تا 1394که یک شماره از آنها دارای منابع انگلیسی‌نویسی شده بودند انتخاب و با مطالعه طولی و روش‌های آمار توصیفی داده‌های به‌دست آمده تحلیل شد. یاف...

متن کامل

تعامل تلفظ و نگارش ارتباط بین مشکلات تلفظی و خطاهای نگارشی فارسی آموزان غیر فارسی زبان

آنچه در پژوهش های انجام شده در حوزة آموزش زبان فارسی بیشتر دیده می شود، جدایی آموزش تلفظ از آموزش نگارش است. در این پژوهش، با تمرکز بر خطاهای زبانی زبان آموزان فارسی در حوزة آواها، به بررسی رابطة بین خطاهای تلفظی موجود در گفتار آنان با خطاهای موجود در نوشتار همان زبان آموزان پرداخته ایم. با این بررسی درصددیم تا نشان دهیم این دو حوزه اندرکنش های فراوانی داشته و تقویت یکی به معنی تقویت دیگری است....

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 33  شماره 3

صفحات  1087- 1110

تاریخ انتشار 2018-06

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023